查看原文
其他

增强AR技术,未来生活会更简单?

汪诘 科学有故事 2020-02-06

>> 本期内容改编自湖南科技出版社的《迷人的技术》,本节目的播出已经获得了湖南科技出版社的授权,在此表示感谢。




本文 5493 字,阅读大约需要 14 分钟


在未来,很可能会发生这样的场景,当你的老板怒气冲冲地训斥你的时候,在你的眼里就会看到一只鸟落在了老板的秃头上,而且那只鸟还在尽情地拉屎,你听到的训斥声也变成了呼啦啦的风声,周围的环境是一片海滩。这种事情已经离我们并不遥远了,这就是增强现实技术,简称 AR。我们今天要聊的就是这个话题。

在听到 AR 之前,你一定知道 VR 也就是虚拟现实技术,现在一幅最便宜的 VR 眼镜大概也就几十元钱。那么 AR 和 VR 有什么区别呢?VR 占用了你所有的视野,你看到的所有东西都是计算机提供的。AR 则不一样,大部分视觉还是你的眼睛看到的现实景物。但是在现实的景物之上叠加了计算机生成的内容。相对来讲,AR 更加复杂一些。但是似乎 AR 有更加广泛的用途。随着手机的普及,一些放低了要求的 AR 游戏纷纷出现。比如前一阵子很火的那个到处抓小精灵的 AR 游戏。


图:Pokemon Go 游戏场景


要完成类似抓小精灵的游戏,有几个技术难关要过。首先是能够根据摄像头看到的画面计算出三维的场景,这堵墙离我们有多远。只有这些数据的计算是完全准确的,计算机才能根据我们手机屏幕的实际大小,保证叠加上去的虚拟图像和摄像头看到的景物完美的融合。过去是没有这个技术的,过去也有一种产品,在一本书上留一些空白页,在纸上有几个特殊的标记,只有借助特殊标记,手机才能计算出拍摄的角度,书本离得多远这些信息。然后在纸上叠加一个小恐龙,或者的小怪兽。孩子们是非常喜欢着这样的带 AR 效果的图书的。现在已经不再需要专门的标记了,于是 AR 应用的范围就大大拓宽。


不过这种 AR 还算是低端的 AR,因为还是要借助手机的屏幕。虚拟的影像没办法直接叠加到人眼自然视野上。距离大家设想的目标还很远呢。


VR 前两年着实热炒了一阵子,最近又没什么声音了。大家可能也见到过 VR 设备,一般来讲是少不了一套非常厚重的头戴装置的。远比眼镜要重得多。不是厂商不想做轻薄,实在是光学方面的要求太高,没办法做轻薄。


AR 在视觉方面比 VR 还要麻烦。AR 的源头在我看来是可以追溯到军用技术上。可能有人用过军用的望远镜,在军用望远镜之中会有刻度标记,这些标记是叠加在远方的景物之上的。本质上,AR 装置就是一个放大倍数为 1 的望远镜。不管放大倍数是多少,总是要两片镜片,而且要间隔一定的距离。这也就是过去 AR 设备体积无法缩小的一个原因。


后来,航空科技大发展。战斗机上开始普遍安装平视显示器。也就是把飞机的各项数据投影到玻璃窗上,驾驶员透过飞机玻璃窗就可以看到外界的景物和显示的数据。如果你玩过空战游戏的话就知道,导弹锁定的边框就是直接和远方的景物叠加的,你只要操纵飞机把敌机装进这个框子,导弹就会捕捉到目标锁定,然后就可以发射了。


平视显示器虽然很方便,但是驾驶员要操纵飞机对准目标,这个过程还是比较费劲的。假如能够让驾驶员看到哪里就打到哪里就好了。随着导弹离轴发射能力越来越强。苏联米格 29 战斗机率先把瞄准具安装到了驾驶员的头盔上。不需要调整飞机的机头对准敌机,只要驾驶员歪过头去看着目标就可以锁定了。武装直升机也采用了这项技术,直升机带着的重机枪也是跟随着操纵员的脑袋运动的,操纵员脸朝哪边,机枪就对准那边,真是可以看到哪里打到底哪里。


图:AR 头盔示意图


美国最新的 F35 战斗机甚至想把所有数据都显示在驾驶员的眼镜上,因此 F35 驾驶员的头盔非常的大,外形也不好看。就是因为飞行头盔要负责显示大量的数据。需要安装各种电子器件。整个头盔实际上就是 AR 设备。J20 驾驶员的头盔上也预留了接口,未来也许可以接上我国国产的 AR 设备。


所以,对于军方来讲,AR 几乎是刚需,他们下的功夫是最大的。他们的野心也非常大,做的研究也非常的透彻。


现在战斗机的驾驶舱为了照顾视野,通常都是气泡形的,但是这也只能保证头顶这半个球的视野。脚底下是没办法的,被飞机机身遮挡了,假如在飞机上安装一系列摄像头,然后把图像投影到驾驶员的眼睛里,岂不是就可以达到让驾驶员看穿驾驶舱,直接看到脚底下景物的目的吗?这对战斗机飞行员来讲,太重要了。


对于运输机或者是客机来讲,他们也有对 AR 系统的需求。假如夜间飞行的时候,驾驶员在 AR 系统之中看到的不是一片漆黑。而是根据卫星地图和等高线制作的虚拟的地形,当然对飞机的驾驶员是非常有帮助的。


但是理想很美好,现实却很残酷。战斗机驾驶员那么好的身体素质,在做实验的时候仍然发生了头晕的现象。在3D 游戏刚刚兴盛的时候,某些玩家就有头晕想吐的情况。因为景物在转动,身体却没动,这种不协调导致人脑判断一定是吃了什么毒蘑菇,导致出现幻觉,因此人体作出的应对反应就是恶心呕吐。晕车晕船都是一样的道理。


所以,最早开发 VR 和 AR 的都会碰上这个问题,假如脑袋转了,眼镜里的场景转动延迟,人就会不舒服。画面分辨率太渣也不行。相比之下,AR 好一些。因为人眼还是可以看到真实景象的。现在各大厂商都想尽办法提高设备性能,这样可以解决不少问题。


但是,还有一个老大难问题是不好解决的。那就是眼睛对焦的问题,对 VR 是很严重的,拍摄的焦点和人眼自己的焦点不一致。这个问题似乎没办法解决。只能退而求其次,虚拟场景中的东西都放到 3 米以外。这样人眼睛会舒服一些。这也算是一种妥协吧。说到底,我们的眼睛在看外界景物的时候,光是从四面八方来的。但是 VR 的投影系统,来光方向是非常单一的。眼睛是能够察觉到这两者的区别的,不适感总会存在。只能尽量减少罢了。


到目前为止,AR 或者 VR 装备都是非常重的。要想减轻重量,还有很多问题要克服。要想把显示器里的图像和人眼看到的真实世界叠加起来,当然是需要一套光学设备的,这种光学设备并不简单。绝不是带上一副普通的眼镜能解决的,因此设备重量通常都不轻,起码对鼻梁是不友好的。有一家叫 Innovega 的公司有了新的进展,腾讯还投了 300 万美元。


这家公司的解决方案很有意思。首先需要带上一副隐形眼镜。然后再带上一副有框的 AR 眼镜,看外观已经很轻薄了。镜片一定要用两套,只不过这家公司的解决方案是用隐形眼镜+普通眼镜的方案。我大致看了一下这个方案,隐形眼镜应该是一种度数很高的凸透镜。这样的话,就可以把人眼的焦点调整到非常近的地方,也就是眼镜框上的小屏幕上。但是这样看外界景物就完全看不清楚了,焦点不对嘛。所以要在屏幕后边放上普通眼镜的镜片,这个镜片可以抵消隐形眼镜的屈光度。让人眼看到正常的景象。这样就实现了景物和屏幕显示合成在了一起。



图:Innovega 宣传图


不得不承认,这个办法还是蛮巧妙的,视野也非常开阔。但是,隐形眼镜是医疗器械,生产要求非常高。假如用户本身就是个近视眼,里外两副眼镜是要专门去验光配镜的。这也就增加了额外的成本。


AR 眼镜只是增强现实技术的一部分。气味的合成目前还不实用,只能说是聊胜于无。声音方面的技术相对成熟得多。现在用途最广泛的穿戴式设备就是耳机。


家庭影院 5.1 或者 7.1 声道音响可以营造出立体感非常强的声场。人有两个耳朵,因此人的听觉系统能分辨出声音是从哪边传来,大致距离有多远。立体声音响系统起码有左右两个音箱,但是两个音箱并不能很好地模拟声音从正前方传来。因此需要加一个中置音箱。


从脑后传来的声音,左右的主音箱也不能很好的模拟。因此在后边也要放置两个音箱,这就是所谓的环绕声系统,这就需要 5 个音箱才能解决问题。高级一点,环绕声要用 4 个音箱。那么就需要 7 个音箱。加上一个低音炮,就构成了所谓的 5.1 或者是 7.1 系统。有些高档电影院里的音响系统还要更强大更复杂。


但是,我们说回来,AR 系统毕竟是个随身的系统,不可能带着 5.1 环绕系统上街。只能靠耳机去模拟。好在现在的计算机够强大,可以模拟出很多复杂的环绕效果。相对来讲技术算是最成熟的了。


那么好了,一套实用的增强现实套装起码是包括 AR 眼镜和耳机的。气味和触觉我们暂时不考虑了。我们还需要摄像头传感装置,这样才能把虚拟的内容和现实视野中的东西混合得天衣无缝。我们还需要 GPS 传感器,这样我们才知道现在的具体位置。还需要精确的运动状态传感器。我们才能知道眼朝哪边看,头朝哪边歪。


假如这套系统真的能工作的话,作为一个旅游者是会很爽的。走进故宫,你看到了前方汉白玉高台上矗立的太和殿,立刻视野中就出现了有关的文字简介。你在太和殿前的广场上,还可以在眼前看到跪列的文武大臣。你的耳朵中还能传来他们三呼万岁的声音。假如你去故宫后门的景山公园游览,在 AR 场景里,你说不定会看到吊在那一棵歪脖树上的崇祯皇帝,额!这个还是算了。


这个设想虽然很美好,但是也会遇到一大堆的麻烦。问题就出在摄像头上,人家怕你偷拍,怕的是隐私泄露。大家可以设想一下,配合人脸识别和云计算,会不会出现另外一种应用呢。你在 AR 眼镜后面看到的是每个行人的头顶都有一个黄色标签,写的是这个人的姓名和职业。


当系统发觉你出汗量增加的时候,在你视野的左上角出现冷饮店的广告,你感觉又怎么样呢?你是爽还是不爽呢?隐私泄露造成的麻烦其实还要更多。你佩戴的 AR 装置时时刻刻都在扫描周围的景物。对于系统提供商来讲,这也无可厚非,这是AR必备的功能。你的眼镜没有强大的计算能力,必须通过 5G 网络传递到云端去运算。好像也很说的通。但是不知不觉间,行人的隐私也都荡然无存了。还记得 Google 的那个失败的眼镜吗?就是在隐私保护上出了大问题。


还有一个大问题就是所谓的网络入侵的问题。假如你的 AR 眼镜被人黑了。你正在路上开车,突然眼前飞出一只翼手龙,你吓了一跳,于是就撞了。这样的事情也是防不胜防的。


总之,一个新的事物总会带来好的影响,假如没有用处,工程师们也不会费劲巴拉的发明它。但是也会带来负面的影响,可能这些影响还是大家所意想不到的。没办法,这就是辩证法嘛。


如果 AR 技术成熟的话,首先发生天翻地覆变化的就是娱乐业。艺术家们会非常开心的。现在,不管是 AR 还是VR,主要用途是用来玩游戏的。当然,未来这些技术会向其他领域漫延。比如在教育领域。


图:目前无论 AR 还是 VR,基本都是游戏用途


假如在立体几何的教学之中,你能直观的看到那些圆柱体,圆锥体。那要比老师在黑板上画示意图生动多了。你甚至可以亲手操控切开一个圆锥体,看看什么叫圆锥曲线。


化学课上,你也可以直接看到化学反应过程之中,原子的相互作用是如何实现的,这不是很美妙吗?


克雷格博士同伊利诺伊大学的兽医学院共同创造出了一头原物大小的玻璃纤维牛。如果你通过一款手机应用程序来看这头牛,那你便会看到这头牛的内脏分布,这对兽医学学生来说将是一件令人惊叹的工具,这可以让他们把内脏的位置以立体的形式给形象化。这还是利用现有的技术来实现的,假如未来不需要用手机来辅助,直接用 AR 眼镜来观察,那又是一种什么样的效果呢?


我们再列举一个生活中的例子,一台打印机坏了。很多人可能会觉得自己搞不定,其实这又有什么搞不定的呢?到网上去下载一份维修指南。你在 AR 眼镜里会看到所有的提示步骤。先拆那个螺丝都会有明显的标签指示,有什么好怕的呢?同理,你是不是可以下载一份炒菜指南呢?说不定你就是厨艺高手了。


图:AR 的未来有无限可能


我们再想想看,假如这些技术被用在了医学方面呢?在战争时期,或者在贫穷国家的农村地区,也许会出现需要立刻进行专业手术的情况。可周围的外科医生却从没有接受过专门的培训。现在情况紧急,AR 在这种情况下也许能帮得上忙。使用 AR 应用程序(目前正在被开发),专家们在远端给前方做手术的人提供各种信息。比如说在前方手术医生的视野中会出现一个大箭头,告诉他在这里下刀。


做手术的医生眼前看到的躯体或许已经叠加上了病人过去拍摄的 CT 扫描影像。他的动作可以更加精确,这些可以大大提升效率。我想这个技术对如今流行的整容手术也是有用的,医生可以把整容后的效果叠加到现在整容者真实的脸上看看效果。


最重要的是,AR 将给予我们机会去按我们的想象来重建这个世界。随着人类从草原上迁移到了摩天大楼中,我们抛弃了很多虚妄但令人安慰的神话和幻想,但使用正确的技术,我们能使龙翔九天,或者让小精灵在花园中起舞。我们能漫步在虚幻的世界里,那里有我们逝去的亲人。我们能探索我们个性的特点,甚至还能在某种意义上让人起死回生。



最后,我不得不再多说几句。一个新的事物是不是真的有生命力。不仅仅是看优缺点,技术成长的途径和时机也是非常重要的。我们是不是一定要去追求完美的 AR 眼镜解决方案呢?我觉得,从策略上讲不一定要这么做。一个大的目标是可以分解成若干的小目标的。每一步都可以变成实实在在的产品。而不是在实验室里憋大招。


比如说,如今开车少不了用手机导航。可是手机屏幕那么小,用眼睛去看的时候,视线难免要离开前方,安全隐患不能说没有。最好的办法就是靠 AR 眼镜,把地图叠加到眼前。或者退而求其次,在眼角余光看得到的地方显示一个指示箭头,朝左还是朝右。现在,高端的品牌的确是有把飞机的平视显示器移植到了轿车上。但是普通轿车是安装不了的,用 AR 眼镜解决倒是个不错的办法。


至于现实增强技术的未来会怎么样,我现在也无法预料。历史上的确出现过看上去很美,但是最后被扫进历史尘埃的技术。比如说喷气背包技术。也有那种非常顽强,总也打不死的技术,比如说飞行汽车就是是这一类。一百多年来,不断有人试图搞出会飞的汽车,也有人取得了不错的成绩,但是怎么也没有办法真正的运用到生活中。


AR 到底会走向何方,我们也只能是拭目以待了。我也想听听你们对 AR 未来的看法,你认为 AR 会在不久的将来走入每一个普通人的生活吗?



科友们都在看

关于可控核聚变的两大疑问:到底难在哪儿?到底能带来哪些革命性的巨变?

小行星开采,有些早鸟已经在行动

太空电梯,不止是拥有不可估量的商业价值

通往太空的廉价方式,存在吗?

精准医疗:更好的治疗?还是隐私的公开?



科学有故事

汪诘微信小号

106113408


--------


商务联系

a18290273607



▼ 我的书在这里可以买到

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存